No domínio da Inteligência Artificial, o modelamento de sequências muda o foco dos instantâneos estáticos para fluxos temporais. Tarefas padrão de aprendizado de máquina frequentemente assumem que os pontos de dados são Independentes e Identicamente Distribuídos (IID), ou seja, a ordem das amostras não influencia o resultado.
O modelamento de sequências rejeita explicitamente isso, concentrando-se em três pilares centrais:
- Violação da Invariância por Permutação: Em dados tabulares, a ordem das colunas é arbitrária. Em sequências, a ordem é o atributo principal. Trocar "O gato comeu o rato" por "O rato comeu o gato" muda fundamentalmente o verdade semântica fundamental apesar de termos idênticos.
- Autoregressivo Propriedades: Assumimos que uma observação no tempo $t$ é matematicamente condicionada por sua história ($t-1, t-2, \dots, 1$). Isso exige probabilidades de transição para capturar como a informação evolui.
- Mapeamento de Comprimento Variável: Ao contrário de grade fixas de 28x28 pixels, sequências como frases ou ondas sísmicas são elásticas. Os modelos devem processar entradas de comprimento $N$ e produzir saídas de comprimento $M$ usando parâmetros consistentes.